EvoClass
AI012
Khám phá sâu về các mô hình ngôn ngữ lớn
Các trường hợp nghiên cứu và chiến lược triển khai mô hình ngôn ngữ lớn phổ biến
Mục tiêu học tập
- Phân tích sự khác biệt về cấu trúc giữa các kiến trúc Encoder-only (BERT), Decoder-only (GPT) và Encoder-Decoder (T5).
- Giải thích quy trình huấn luyện ba giai đoạn: Tiền huấn luyện (mô hình cơ sở), Tinh chỉnh hướng dẫn (SFT), và Cân bằng (RLHF/PPO).
- So sánh hiệu suất, các quy luật mở rộng và những đổi mới về kiến trúc của các mô hình ngôn ngữ lớn phổ biến như GPT, Llama, Qwen và DeepSeek.